1번
\(X_1, X_2, X_3\)는 서로 독립이고 각각 평균이 \(λ_1, λ_2, λ_3\)인 포아송분포를 따른다고 한다. (평균이 \(λ\)인 포아송분포의 확률밀도함수는 \(f(x) = \dfrac{e^{−λ}λ^x}{x!} , x = 0, 1, 2, 3, \dots\) 이다.)
(a)
모2차 적률을 구하시오.
2차 모적률 \(\mu_2 = E(X^2)=Var(X)+(E(X))^2=\lambda + \lambda^2=\lambda(1+\lambda)\)
(b)
적률생성함수를 이용하여 \(X_1 + X_2 + X_3\)의 분포를 구하시오.|
\(Y=X_1+X_2+X_3\)
\(M_Y(t)=E(e^{t \sum_{i=1}^3 X_i})=E(e^{tX_1+tX_2+tX_3})\)
서로 독립이므로
=\(E(e^{tX_1}e^{tX_2}e^{tX_2})=E(e^{tX_1})E(e^{tX_2})E(e^{tX_3})=M_{X_1}(t)M_{X_2}(t)M_{X_3}(t)\)
=\(e^{\lambda_1(e^t-1)}e^{\lambda_2(e^t-1)}e^{\lambda_3(e^t-1)}=e^{(e^t-1)(\lambda_1+\lambda_2+\lambda_3)}\)
평균이 \(\lambda_1+\lambda_2+\lambda_3\)인 포아송 분포이다.
(c)
\(P(X_1 = x|X_1 + X_2 + X_3 = t)\)을 구하시오.
\(=\dfrac{P(X_1=x,X_2+X_3=t-x)}{P(X_1+X_2+X_3=t)}\)
\(P(X_1=x)=\dfrac{e^{-\lambda_1} \lambda_1^x}{x!}\)
\(P(X_2 + X_3 = t - x) = \dfrac{e^{-(\lambda_2 + \lambda_3)} (\lambda_2 + \lambda_3)^{t - x}}{(t - x)!}\)
\(P(X_1 + X_2 + X_3 = t) = \dfrac{e^{-(\lambda_1 + \lambda_2 + \lambda_3)} (\lambda_1 + \lambda_2 + \lambda_3)^t}{t!}\)
\(P(X_1 = x | X_1 + X_2 + X_3 = t) = \dfrac{\dfrac{e^{-\lambda_1} \lambda_1^x}{x!} \cdot \dfrac{e^{-(\lambda_2 + \lambda_3)} (\lambda_2 + \lambda_3)^{t - x}}{(t - x)!}}{\dfrac{e^{-(\lambda_1 + \lambda_2 + \lambda_3)} (\lambda_1 + \lambda_2 + \lambda_3)^t}{t!}}\)
\(P(X_1 = x | X_1 + X_2 + X_3 = t) = \dfrac{\lambda_1^x (\lambda_2 + \lambda_3)^{t - x} \cdot t!}{(\lambda_1 + \lambda_2 + \lambda_3)^t \cdot x! \cdot (t - x)!}\)
2번
\((X,Y)\)는 다음과 같은 이변량 정규분포를 따를 때
\(f_{X,Y}(x, y) = \dfrac{1}{2π \sqrt{1 − ρ^2}} exp \left[− \dfrac{1}{2(1-\rho^2)} \left( x^2+y^2-2\rho xy \right) \right]\)
\(U =\dfrac{X + Y}{2}\)와 \(V =\dfrac{X − Y}{2}\)에 대하여 다음을 구하시오.
(풀이)
위 식에서 \((X,Y)\)가 이변량 정규분포를 따르므로
\((X,Y)\)~\(BVN(\mu_X, \mu_Y, \sigma_X, \sigma_Y, \rho)\)를 따른다.
위 식을 보면 \(\mu_X=\mu_Y=0\)이고, \(\sigma_X=\sigma_Y=1\)이므로 \((X,Y)\)~\(BVN(0, 0, 1, 1, \rho)\)을 따른다.
이변량 확률벡터 \((X,Y)\)가 위와 같은 분포를 가지면, \(X\)와 \(Y\)의 주변확률분포는
\(X\) ~ \(N(\mu_X,\sigma_X^2)\) 이므로, \(X\)~\(N(0,1)\)을 따르고,
\(Y\) ~ \(N(\mu_Y,\sigma_Y^2)\) 이므로, \(Y\)~\(N(0,1)\)을 따른다.,
(a)
\(Cov(U,V)\)
=\(Cov(U,V)=Cov(\dfrac{X}{2}+\dfrac{Y}{2},\dfrac{X}{2}-\dfrac{Y}{2})=\dfrac{1}{4}(Cov(X+Y,X-Y))=\dfrac{1}{4}(Cov(X,X)-Cov(X,Y)+Cov(Y,X)-Cov(Y,Y))=\dfrac{1}{4}(Var(X)-Var(Y)-Cov(X,Y)+Cov(Y,X))=\dfrac{1}{4}(1-1+\rho-\rho)=0\)
\(Cov(X,Y)=\rho \sigma_x \sigma_Y = \rho \times 1 \times 1 = \rho\)
(b)
\((U, V)\)의 결합확률밀도함수
\(J=\frac{1}{2}, X=U+V, Y=U-V\)
\(f_{U,V}(u,v)=f_{X,Y}(x,y)|J|=f_{X,Y}(u+v,u-v)\frac{1}{2}= \dfrac{1}{4π \sqrt{1 − ρ^2}} exp \left[− \dfrac{1}{2(1-\rho^2)} \left( (u+v)^2+(u-v)^2-2\rho (u+v)(u-v) \right) \right]= \dfrac{1}{4π \sqrt{1 − ρ^2}} exp \left[− \dfrac{1}{1-\rho^2} \left( u^2+v^2-2\rho (u^2-v^2) \right) \right]\)
3번
\(U(0, 1)\), 즉 \(f(x) = I(0 < x < 1)\)로부터의 랜덤표본 \(X_1, . . . , X_n\)에 대하여 다음을 구하시오
(a)
확률변수 \(Y = − log(1 − X_1)\)의 확률밀도함수
\(g(X)=-log(1-X_1)\)
\(g^{-1}(Y)=1-e^{-y}\)
\(f_Y(y)=f_X(g^{-1}(y))|\frac{dg^{-1}(y)}{dy}|=f_x(1-e^{-y})|e^{-y}|=e^{-y}(y>0)\)
(b)
\(k\)번째 순서 통계량 \(X_{(k)}\)의 확률밀도함수를 구하고, 분포 이름을 명시하시오
\(f(x)=I(0<x<1, F(x)=x(I(0<x<1))\)
\(f_{X_{n}}(x)=n \begin{pmatrix} n-1 \\ k-1\end{pmatrix} f(x) F(x)^{k-1} (1-F(X))^{n-k}\)
= \(n \begin{pmatrix} n-1 \\ k-1 \end{pmatrix} x^{k-1}(1-x)^{n-k}\)
위식은 베타분포 \(B(k, n-k+1)\)을 따른다.
(c)
표본범위 \(X_{(n)} − X_{(1)}\)의 확률밀도함수와 기댓값을 구하시오.
\(X_{(n)}\) ~ \(B(n,1)\)을 따르고, \(X_{(1)}\) ~ \(B(1,n)\)을 따른다.
\(E(X_{(n)}-X_{(1)})=E(X_{(n)})-E(X_{(1)})=\dfrac{n}{n+1}-\dfrac{1}{n+1}=\dfrac{n-1}{n+1}\)
결합확률밀도함수
\(f_{X_{(n)}}(x)=nx^{n-1}\)
\(f_{X_{(1)}}(x)=n(1-x)^{n-1}\)
\(f_{X_{(n)},X_{(1)}}(x_{(n)},x_{(1)})=\dfrac{n!}{1!(n-2)!1!}f(x_1) (F(X_n)-F(X_1))^{n-2}f(x_n)\)
=\(n(n-1)\left( X_n-X_1 \right)^{n-2}\)
표본범위 \(X_{(n)} - X_{(1)}\)의 확률밀도함수
\(R=X_{(n)}-X_{(1)}, S=X_{(1)}\)로 놓으면 \(X_{(n)}=R+S, X_{(1)}=S, |J|=1, 0<S<R+S<\theta\)
\(g(R,S)=f(S,R+S)|J| = n(n-1)\left( X_n-X_1 \right)^{n-2}I(0<S<R+S<1)\)
\(g(R)= n(n-1)R^{n-2} \int_0^{1-R} 1 ds = n(n-1)R^{n-2}(1-R)I(0<R<1)\)
4번
\(X_1, \dots, X_n\)과 \(Y_1,\dots , Y_m\)은 각각 \(N(0, 1)\)과 \(N(1, 4)\)로부터의 서로 독립인 랜덤표본이라 고 한다. 다음에 답하시오. 자유도를 가지고 있는 분포의 경우 자유도도 명시하시오. (확률밀도함수 대신에 정규분포로부터의 표본에 관련된 분포적 사실을 사용할 수 있습 니다.)
(a)
\(\bar X + \bar Y\) 의 분포, 평균과 분산을 구하시오
\(\bar X\) ~ \(N(0,\frac{1}{n}), \bar Y\) ~ \(N(1,\frac{4}{m})\)
\(\bar X + \bar Y\) ~ \(N(1,\frac{1}{n}+\frac{4}{m})\)이고 평균은 1, 분산은 \(\frac{1}{n}+\frac{4}{m}\)이다.
(b)
\(\sum_{i=1}^m(Y_i − \bar Y )^2\)의 분산을 구하시오
\(S_m^2= \dfrac{\sum_{i=1}^m(Y_i-\bar Y)^2}{m-1}\)
\(\dfrac{(m-1)S_m^2}{4}=\dfrac{\sum_{i=1}^m (Y_i-\bar Y)^2}{4}\) ~ \(\chi^2_{m-1}\)
\(Var(\sum_{i=1}^m(Y_i − \bar Y )^2)=Var \left(\dfrac{\sum_{i=1}^m(Y_i − \bar Y )^2}{4}\times 4 \right)=16 Var \left(\dfrac{\sum_{i=1}^m(Y_i − \bar Y )^2}{4}\right)=32(m-1)\)
(c)
\(\sum_{i=1}^n X_i^2\) 의 분포를 구하시오.
\(\sum_{i=1}^n \left( \dfrac{X_i-\mu}{\sigma} \right)^2 = \sum_{i=1}^n \left( \dfrac{X_i-0}{1} \right)^2=\sum_{i=1}^n X_i^2\) ~ \(\chi^2_n\)
자유도가 n인 카이제곱 분포를 따른다.
(d)
\(C\dfrac{\sum_{i=1}^n (X_i^-\bar X)^2}{\sum_{i=1}^m(Y_i − \bar Y )^2}\) 이 F분포를 따르는 통계량이 되기 위한 상수 C의 값을 구하고, 이 F분포의 자유도를 명시하시오.
\(\sum_{i=1}^n X_i^2\) ~ \(\chi^2_{n-1}\)
\(\dfrac{\sum_{i=1}^m (Y_i-\bar Y)^2}{4}\) ~ \(\chi^2_{m-1}\)
\(C \dfrac{\dfrac{\sum_{i=1}^n X_i^2}{1}/ n-1} {\dfrac{\sum_{i=1}^m (Y_i-\bar Y)^2 }{4}/m-1}\)
\(C=\dfrac{4(m-1)}{n-1}\)이고 위 식은 \(F(n-1,m-1)\)을 따른다.
(e)
\(2\sqrt{m − 1}\dfrac{X_1}{\sqrt{\sum_{i=1}^m (Y_i-\bar Y)^2}}\) 의 분포를 구하시오.
=\(\dfrac{\dfrac{X_1}{1}}{\dfrac{\sqrt{\sum_{i=1}^m (Y_i-\bar Y)^2}}{\sqrt{4(m-1)}}}=\dfrac{Z}{\sqrt{U/m-1}}=T\)
단, \(Z\) ~ \(N(0,1)\)이고 \(U\) ~ \(\chi_{m-1}^2\)이다.
위 분포는 자유도가 m-1인 T분포이다.
5번
\(X_i ∼ N(iθ, 1), i = 1, 2, \dots, n\)이고 서로 독립인 확률변수이다
(a)
\(θ\)의 가능도함수 \(L(θ)\)를 구하시오
\(L(\theta: x_1, \dots, x_n)= f(x_1,\dots,x_n;\theta)=\Pi_{i=1}^n f_i (x_i ; \theta) = \Pi_{i=1}^n \frac{1}{\sqrt{2\pi}} e^{-\frac{(X_i-i\theta)^2}{2}}=(\frac{1}{2\pi})^{n/2}e^{-\frac{\sum_{i=1}^n(X_i-i\theta)^2}{2}}\)
(b)
\(θ\)의 최대가능도 추정량 \(\hat θ =\dfrac{\sum_{i=1}^n iX_i}{\sum_{i=1}^n i^2}\)임을 보이시오.
\(l(\theta)=\frac{n}{2}log 2\pi - \frac{\sum_{i=1}^n (X_i - i\theta)^2}{2}\)
\(l'(\theta) = \sum_{i=1}^n i(X_i - i\theta) = 0\)
\(\hat \theta^{MLE} = \dfrac{\sum_{i=1}^n iX_i}{\sum_{i=1}^n i^2}\)
(c)
\(\hat \theta\)의 평균제곱오차를 구하시오.
\(iX_i\) ~ \(N(i^2 \theta, i^2)\)
\(\sum_{i=1}^n i X_i\) ~ \(N(\sum_{i=1}^n i^2 \theta, \sum_{i=1}^n i^2)\)
\(E(\hat \theta) = E\left( \dfrac{\sum_{i=1}^n iX_i}{\sum_{i=1}^n i^2} \right)=\dfrac{1}{\sum_{i=1}^n i^2} E(\sum_{i=1}^n iX_i)=\dfrac{\sum_{i=1}^n i^2 \theta}{\sum_{i=1}^n i^2}=\theta\)
\(E(\hat \theta)=\theta\) 이면 비편향추정량
\(MSE(\hat \theta) = E(\hat \theta - \theta)^2= Var(\hat \theta) + Bias^2(\theta)\)
비편향추정량일 때는 Bias=0이다.
즉, \(MSE(\hat \theta) = Var(\hat \theta)\)
\(Var(\hat \theta) = Var \left(\dfrac{\sum_{i=1}^n iX_i}{\sum_{i=1}^n i^2} \right)=\dfrac{1}{(\sum_{i=1}^n i^2)^2}Var(\sum_{i=1}^n iX_i)=\dfrac{\sum_{i=1}^n i^2}{(\sum_{i=1}^n i^2)^2}=\dfrac{1}{\sum_{i=1}^n i^2}\)
(d)
크래머-라오 하한을 구하고 \(\hat θ\)의 분산과 비교하시오.
\(I(\theta)=E \left( (\dfrac{\partial}{\partial \theta} log f(X;\theta))^2 \right)\)
\(f(X;\theta)=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{(X_i - i\theta)^2}{2}\right)\)
\(logf(X;\theta) = log \frac{1}{\sqrt{2\pi}}-\frac{1}{2}(X_i-i\theta)^2\)
\(\dfrac{\partial}{\partial \theta}log f(X;\theta) = -i(X_i-i\theta)\)
\(I(\theta)=E \left( (\dfrac{\partial}{\partial \theta} log f(X;\theta))^2 \right)=E(i^2(X_i-i\theta)^2)=i^2E \left[ (X_i-i\theta) \right]^2=i^2\)
\(\because E \left[ (X_i-i\theta) \right]^2 = Var(X_i)=1\)
CRLB: \(\dfrac{g'(\theta)}{nI(\theta)}=\dfrac{1}{\sum_{i=1}^n I(\theta)}=\dfrac{1}{\sum_{i=1}^n i^2}\)
6번(잘모르겠땅..)
\(X_1, X_2, \dots , X_n\)이 \(POI(λ)\)로부터의 랜덤샘플이고, \(θ = P(X_1 ≤ 1)\)이라고 하자. 다음을구하시오.
(a)
\(\bar X_n\)의 분포
\(M_{\bar X_n}(t) = E(e^{t \bar X_n})=E(e^{\frac{t}{n}X_1+\dots+\frac{t}{n}X_n})=E(e^{\frac{t}{n}X_1}) \dots E(e^{\frac{t}{n}X_n})=M_{X_1}(\frac{t}{n})\dots M_{X_n}(\frac{t}{n})=[exp(\lambda(e^{\frac{t}{n}}-1))]^n\)
n이 무한히 커지면 정규분포 따르는걸루,,,
(b)
\(θ\)의 최대가능도 추정량
\(θ = P(X_1 ≤ 1)\)
\(θ = P(X_1 = 0) + P(X_1 = 1) = e^{-λ} + λe^{-λ}\)
\(\frac{dθ}{dλ} = -e^{-λ} + e^{-λ} - λe^{-λ} = -λe^{-λ} = 0\)
\(\hat \theta^{MLE}=1\)
문제오류인가 무엇인가……….m
\(poi(\theta)\)로 풀어보면 나오긴하는데..
(c)
\(\hat \theta^{MLE}\)의 기대값
(d)
\(\sqrt{n}(\hat \theta^{MLE}-\theta)\)의 점근분포
\(N(0,\frac{1}{I(\theta)})=N(0,\theta)\)
7번
어느 보험계리사가 두 그룹의 보험계약자들의 평균 보험료 청구 시간을 비교하고자 다음과 같이 각 그룹으로부터 서로 독립인 두 랜덤샘플을 얻었다고 한다.
Group A: \(X_1, X_2, \dots , X_m\) iid∼ \(EXP(θ_1)\) (평균:\(θ_1\))
Group B: \(Y_1, Y_2, \dots , Y_n\) iid∼ \(EXP(θ_2)\) (평균:\(θ_2\))
(a)
\(Q_1 = \dfrac{2m \bar {X_m}}{θ_1}, Q_2 = \dfrac{2n\bar {Y_n}}{θ_2}\) 라고 할 때 \(Q_1\)과 \(Q_2\)의 분포를 구하시오
\(X_1 \sim EXP(\theta_1)\)
\(\frac{2X_1}{\theta_1} \sim EXP(2)\)
평균이 2인 지수분포를 m번 더하면 자유도가 2m인 카이제곱 분포가 나온다.
\(\frac{2m \bar X_m}{\theta_1} \sim \chi^2_{2m}\)
\(Y\)도 비스하게 하면 \(Q_2\)는 자유도가 2n인 카이제곱 분포를 따른다.
\(Q_1 \sim \chi^2(2m), Q_2 \sim \chi^2(2n)\)
(b)
\(θ_1 = θ_2\)일 때 \(\bar X_m/\bar Y_n\)의 분포를 구하시오
\(\dfrac{Q_1/2m}{Q_2/2n} \sim F(2m,2n)\)
좌변 식을 간단히 해보면,
=\(\dfrac{\dfrac{2m \bar {X_m}}{θ_1 \times 2m}}{\dfrac{2n\bar {Y_n}}{θ_2 \times 2n}}=\dfrac{\bar X_m}{\bar Y_n}\)이므로 이 식은 F분포를 따른다.
(c)
\(θ_1 = θ_2\)일 때 가능도함수와 그 함수의 최대값을 구하시오.
(d)
\(H_0 : θ_1 = θ_2\) vs \(H_1 : θ_1 \neq θ_2\)을 검정하기 위한 유의수준 \(α\)인 가능도비 검정의 기각역을 구하시오